Overview

Dataset statistics

Number of variables42
Number of observations954
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory313.2 KiB
Average record size in memory336.1 B

Variable types

BOOL22
CAT11
NUM6
DATE2
UNSUPPORTED1

Warnings

df_index has unique values Unique
ID has unique values Unique
ID_y has unique values Unique
Частота пасс кур is an unsupported type, check if it needs cleaning or further analysis Unsupported
Возраст курения has 543 (56.9%) zeros Zeros
Сигарет в день has 546 (57.2%) zeros Zeros
Возраст алког has 167 (17.5%) zeros Zeros
Час засыпания has 235 (24.6%) zeros Zeros

Reproduction

Analysis started2022-06-17 14:01:56.952687
Analysis finished2022-06-17 14:02:04.149476
Duration7.2 seconds
Software versionpandas-profiling v2.9.0
Download configurationconfig.yaml

Variables

df_index
Real number (ℝ≥0)

UNIQUE

Distinct954
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean477.1813417
Minimum0
Maximum954
Zeros1
Zeros (%)0.1%
Memory size7.5 KiB
2022-06-17T17:02:04.231286image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Quantile statistics

Minimum0
5-th percentile47.65
Q1238.25
median477.5
Q3715.75
95-th percentile906.35
Maximum954
Range954
Interquartile range (IQR)477.5

Descriptive statistics

Standard deviation275.9167675
Coefficient of variation (CV)0.5782220371
Kurtosis-1.200562814
Mean477.1813417
Median Absolute Deviation (MAD)239
Skewness-0.00171665018
Sum455231
Variance76130.06257
MonotocityStrictly increasing
2022-06-17T17:02:04.346734image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%) 
010.1%
 
64110.1%
 
62910.1%
 
63010.1%
 
63110.1%
 
63210.1%
 
63310.1%
 
63410.1%
 
63510.1%
 
63610.1%
 
Other values (944)94499.0%
 
ValueCountFrequency (%) 
010.1%
 
110.1%
 
210.1%
 
310.1%
 
410.1%
 
ValueCountFrequency (%) 
95410.1%
 
95310.1%
 
95210.1%
 
95110.1%
 
95010.1%
 

ID
Categorical

UNIQUE

Distinct954
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
54-102-358-02
 
1
54-001-096-01
 
1
54-102-271-01
 
1
54-002-021-01
 
1
54-103-030-01
 
1
Other values (949)
949 
ValueCountFrequency (%) 
54-102-358-0210.1%
 
54-001-096-0110.1%
 
54-102-271-0110.1%
 
54-002-021-0110.1%
 
54-103-030-0110.1%
 
54-002-128-0110.1%
 
54-001-025-0210.1%
 
54-002-054-0110.1%
 
54-002-174-0110.1%
 
54-102-239-0210.1%
 
Other values (944)94499.0%
 
2022-06-17T17:02:04.596645image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Frequencies of value counts

Unique

Unique954 ?
Unique (%)100.0%
2022-06-17T17:02:04.702698image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram of lengths of the category

Length

Max length13
Median length13
Mean length13
Min length13

Пол
Categorical

Distinct2
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
Ж
667 
М
287 
ValueCountFrequency (%) 
Ж66769.9%
 
М28730.1%
 
2022-06-17T17:02:04.796422image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Frequencies of value counts

Unique

Unique0 ?
Unique (%)0.0%
2022-06-17T17:02:04.843289image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:04.905772image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram of lengths of the category

Length

Max length1
Median length1
Mean length1
Min length1

Семья
Categorical

Distinct6
Distinct (%)0.6%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
в браке в настоящее время
563 
вдовец / вдова
143 
в разводе
125 
гражданский брак / проживание с партнером
78 
никогда не был(а) в браке
 
43
ValueCountFrequency (%) 
в браке в настоящее время56359.0%
 
вдовец / вдова14315.0%
 
в разводе12513.1%
 
гражданский брак / проживание с партнером788.2%
 
никогда не был(а) в браке434.5%
 
раздельное проживание (официально не разведены)20.2%
 
2022-06-17T17:02:04.983878image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Frequencies of value counts

Unique

Unique0 ?
Unique (%)0.0%
2022-06-17T17:02:05.046364image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:05.218171image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram of lengths of the category

Length

Max length47
Median length25
Mean length22.60901468
Min length9

Этнос
Categorical

Distinct3
Distinct (%)0.3%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
европейская
930 
другая азиатская (Корея, Малайзия, Таиланд, Вьетнам, Казахстан, Киргизия, Туркмения, Узбекистан, Таджикистан)
 
17
прочее (любая иная этно-расовая группа, не представленная выше)
 
7
ValueCountFrequency (%) 
европейская93097.5%
 
другая азиатская (Корея, Малайзия, Таиланд, Вьетнам, Казахстан, Киргизия, Туркмения, Узбекистан, Таджикистан)171.8%
 
прочее (любая иная этно-расовая группа, не представленная выше)70.7%
 
2022-06-17T17:02:05.327550image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Frequencies of value counts

Unique

Unique0 ?
Unique (%)0.0%
2022-06-17T17:02:05.390039image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:05.468142image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram of lengths of the category

Length

Max length109
Median length11
Mean length13.1278826
Min length11
Distinct18
Distinct (%)1.9%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
Русские
898 
Татары
 
18
Немцы
 
6
Чуваши
 
5
Украинцы
 
4
Other values (13)
 
23
ValueCountFrequency (%) 
Русские89894.1%
 
Татары181.9%
 
Немцы60.6%
 
Чуваши50.5%
 
Украинцы40.4%
 
Азербайджанцы40.4%
 
Казахи20.2%
 
Евреи20.2%
 
Таджики20.2%
 
Армяне20.2%
 
Other values (8)111.2%
 
2022-06-17T17:02:05.561867image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Frequencies of value counts

Unique

Unique5 ?
Unique (%)0.5%
2022-06-17T17:02:05.670396image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram of lengths of the category

Length

Max length21
Median length7
Mean length7.013626834
Min length5

Религия
Categorical

Distinct4
Distinct (%)0.4%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
Христианство
804 
Атеист / агностик
86 
Нет
 
40
Ислам
 
24
ValueCountFrequency (%) 
Христианство80484.3%
 
Атеист / агностик869.0%
 
Нет404.2%
 
Ислам242.5%
 
2022-06-17T17:02:05.764510image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Frequencies of value counts

Unique

Unique0 ?
Unique (%)0.0%
2022-06-17T17:02:05.826996image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:05.905103image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram of lengths of the category

Length

Max length17
Median length12
Mean length11.89727463
Min length3
Distinct4
Distinct (%)0.4%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
4 - профессиональное училище
454 
5 - ВУЗ
313 
3 - средняя школа / закон.среднее / выше среднего
180 
2 - начальная школа
 
7
ValueCountFrequency (%) 
4 - профессиональное училище45447.6%
 
5 - ВУЗ31332.8%
 
3 - средняя школа / закон.среднее / выше среднего18018.9%
 
2 - начальная школа70.7%
 
2022-06-17T17:02:05.983211image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Frequencies of value counts

Unique

Unique0 ?
Unique (%)0.0%
2022-06-17T17:02:06.092531image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:06.186287image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram of lengths of the category

Length

Max length49
Median length28
Mean length25.00628931
Min length7
Distinct11
Distinct (%)1.2%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
дипломированные специалисты
225 
низкоквалифицированные работники
138 
работники, занятые в сфере обслуживания, торговые работники магазинов и рынков
122 
служащие
90 
ремесленники и представители других отраслей промышленности
89 
Other values (6)
290 
ValueCountFrequency (%) 
дипломированные специалисты22523.6%
 
низкоквалифицированные работники13814.5%
 
работники, занятые в сфере обслуживания, торговые работники магазинов и рынков12212.8%
 
служащие909.4%
 
ремесленники и представители других отраслей промышленности899.3%
 
ведение домашнего хозяйства818.5%
 
техники и младшие специалисты808.4%
 
операторы и монтажники установок и машинного оборудования727.5%
 
представители законодат. органов власти, высокопостав. долж.лица и менеджеры353.7%
 
квалифицированные работники сельского хозяйства и рыболовного171.8%
 
2022-06-17T17:02:06.280015image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Frequencies of value counts

Unique

Unique0 ?
Unique (%)0.0%
2022-06-17T17:02:06.373742image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram of lengths of the category

Length

Max length83
Median length29
Mean length40.60062893
Min length8
Distinct2
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
1
499 
0
455 
ValueCountFrequency (%) 
149952.3%
 
045547.7%
 
2022-06-17T17:02:06.436229image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Distinct2
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
0
634 
1
320 
ValueCountFrequency (%) 
063466.5%
 
132033.5%
 
2022-06-17T17:02:06.467470image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Distinct2
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
0
908 
1
 
46
ValueCountFrequency (%) 
090895.2%
 
1464.8%
 
2022-06-17T17:02:06.498720image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Distinct2
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
0
853 
1
101 
ValueCountFrequency (%) 
085389.4%
 
110110.6%
 
2022-06-17T17:02:06.529927image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Distinct2
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
0
839 
1
115 
ValueCountFrequency (%) 
083987.9%
 
111512.1%
 
2022-06-17T17:02:06.561198image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Distinct2
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
0
911 
1
 
43
ValueCountFrequency (%) 
091195.5%
 
1434.5%
 
2022-06-17T17:02:06.592443image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Distinct2
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
0
882 
1
 
72
ValueCountFrequency (%) 
088292.5%
 
1727.5%
 
2022-06-17T17:02:06.623687image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Distinct2
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
0
913 
1
 
41
ValueCountFrequency (%) 
091395.7%
 
1414.3%
 
2022-06-17T17:02:06.656834image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Distinct2
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
0
934 
1
 
20
ValueCountFrequency (%) 
093497.9%
 
1202.1%
 
2022-06-17T17:02:06.686802image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Distinct2
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
0
952 
1
 
2
ValueCountFrequency (%) 
095299.8%
 
120.2%
 
2022-06-17T17:02:06.718070image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Distinct2
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
1
614 
0
340 
ValueCountFrequency (%) 
161464.4%
 
034035.6%
 
2022-06-17T17:02:06.749312image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Distinct2
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
0
903 
1
 
51
ValueCountFrequency (%) 
090394.7%
 
1515.3%
 
2022-06-17T17:02:06.780561image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Distinct2
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
0
616 
1
338 
ValueCountFrequency (%) 
061664.6%
 
133835.4%
 
2022-06-17T17:02:06.811773image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Distinct3
Distinct (%)0.3%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
Никогда не курил(а)
543 
Курит
220 
Бросил(а)
191 
ValueCountFrequency (%) 
Никогда не курил(а)54356.9%
 
Курит22023.1%
 
Бросил(а)19120.0%
 
2022-06-17T17:02:06.889879image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Frequencies of value counts

Unique

Unique0 ?
Unique (%)0.0%
2022-06-17T17:02:06.952364image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:07.014850image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram of lengths of the category

Length

Max length19
Median length19
Mean length13.76939203
Min length5

Возраст курения
Real number (ℝ≥0)

ZEROS

Distinct45
Distinct (%)4.7%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean8.748427673
Minimum0
Maximum58
Zeros543
Zeros (%)56.9%
Memory size7.5 KiB
2022-06-17T17:02:07.108607image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Quantile statistics

Minimum0
5-th percentile0
Q10
median0
Q318
95-th percentile29.35
Maximum58
Range58
Interquartile range (IQR)18

Descriptive statistics

Standard deviation11.36190976
Coefficient of variation (CV)1.298737348
Kurtosis1.001337114
Mean8.748427673
Median Absolute Deviation (MAD)0
Skewness1.137058174
Sum8346
Variance129.0929933
MonotocityNot monotonic
2022-06-17T17:02:07.217955image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram with fixed size bins (bins=45)
ValueCountFrequency (%) 
054356.9%
 
20717.4%
 
18606.3%
 
17454.7%
 
16384.0%
 
15232.4%
 
25171.8%
 
19171.8%
 
30131.4%
 
14101.0%
 
Other values (35)11712.3%
 
ValueCountFrequency (%) 
054356.9%
 
510.1%
 
640.4%
 
780.8%
 
830.3%
 
ValueCountFrequency (%) 
5810.1%
 
5510.1%
 
5410.1%
 
5310.1%
 
5210.1%
 

Сигарет в день
Real number (ℝ≥0)

ZEROS

Distinct24
Distinct (%)2.5%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean6.093291405
Minimum0
Maximum60
Zeros546
Zeros (%)57.2%
Memory size7.5 KiB
2022-06-17T17:02:07.327309image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Quantile statistics

Minimum0
5-th percentile0
Q10
median0
Q310
95-th percentile20
Maximum60
Range60
Interquartile range (IQR)10

Descriptive statistics

Standard deviation9.682618055
Coefficient of variation (CV)1.589062038
Kurtosis4.5038251
Mean6.093291405
Median Absolute Deviation (MAD)0
Skewness1.953327495
Sum5813
Variance93.75309241
MonotocityNot monotonic
2022-06-17T17:02:07.405403image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram with fixed size bins (bins=24)
ValueCountFrequency (%) 
054657.2%
 
2011612.2%
 
10838.7%
 
5363.8%
 
15282.9%
 
30181.9%
 
1171.8%
 
40161.7%
 
4151.6%
 
2151.6%
 
Other values (14)646.7%
 
ValueCountFrequency (%) 
054657.2%
 
1171.8%
 
2151.6%
 
3141.5%
 
4151.6%
 
ValueCountFrequency (%) 
6030.3%
 
5010.1%
 
40161.7%
 
3510.1%
 
30181.9%
 
Distinct2
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
0
730 
1
224 
ValueCountFrequency (%) 
073076.5%
 
122423.5%
 
2022-06-17T17:02:07.467890image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Частота пасс кур
Unsupported

REJECTED
UNSUPPORTED

Missing0
Missing (%)0.0%
Memory size7.6 KiB

Алкоголь
Categorical

Distinct3
Distinct (%)0.3%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
употребляю в настоящее время
633 
никогда не употреблял
165 
ранее употреблял
156 
ValueCountFrequency (%) 
употребляю в настоящее время63366.4%
 
никогда не употреблял16517.3%
 
ранее употреблял15616.4%
 
2022-06-17T17:02:07.530385image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Frequencies of value counts

Unique

Unique0 ?
Unique (%)0.0%
2022-06-17T17:02:07.592867image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:07.672866image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram of lengths of the category

Length

Max length28
Median length28
Mean length24.82704403
Min length16

Возраст алког
Real number (ℝ≥0)

ZEROS

Distinct36
Distinct (%)3.8%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean16.53039832
Minimum0
Maximum63
Zeros167
Zeros (%)17.5%
Memory size7.5 KiB
2022-06-17T17:02:07.765037image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Quantile statistics

Minimum0
5-th percentile0
Q116
median18
Q320
95-th percentile29
Maximum63
Range63
Interquartile range (IQR)4

Descriptive statistics

Standard deviation8.954450343
Coefficient of variation (CV)0.5416959815
Kurtosis1.487822526
Mean16.53039832
Median Absolute Deviation (MAD)2
Skewness-0.2858687395
Sum15770
Variance80.18218095
MonotocityNot monotonic
2022-06-17T17:02:07.874386image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram with fixed size bins (bins=36)
ValueCountFrequency (%) 
2018219.1%
 
016717.5%
 
1816016.8%
 
17919.5%
 
16666.9%
 
25576.0%
 
19424.4%
 
21363.8%
 
15293.0%
 
22212.2%
 
Other values (26)10310.8%
 
ValueCountFrequency (%) 
016717.5%
 
620.2%
 
910.1%
 
1020.2%
 
1250.5%
 
ValueCountFrequency (%) 
6310.1%
 
5020.2%
 
4810.1%
 
4610.1%
 
4510.1%
 
Distinct22
Distinct (%)2.3%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
Minimum2022-06-17 00:00:00
Maximum2022-06-17 23:59:00
2022-06-17T17:02:08.129944image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:08.223671image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram with fixed size bins (bins=22)
Distinct34
Distinct (%)3.6%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
Minimum2022-06-17 00:00:00
Maximum2022-06-17 12:00:00
2022-06-17T17:02:08.317400image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:08.411132image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram with fixed size bins (bins=34)
Distinct2
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
0
738 
1
216 
ValueCountFrequency (%) 
073877.4%
 
121622.6%
 
2022-06-17T17:02:08.489236image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Distinct2
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
0
889 
1
 
65
ValueCountFrequency (%) 
088993.2%
 
1656.8%
 
2022-06-17T17:02:08.520483image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Distinct2
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
0
932 
1
 
22
ValueCountFrequency (%) 
093297.7%
 
1222.3%
 
2022-06-17T17:02:08.536103image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

ID_y
Categorical

UNIQUE

Distinct954
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
54-102-358-02
 
1
54-001-096-01
 
1
54-102-271-01
 
1
54-002-021-01
 
1
54-103-030-01
 
1
Other values (949)
949 
ValueCountFrequency (%) 
54-102-358-0210.1%
 
54-001-096-0110.1%
 
54-102-271-0110.1%
 
54-002-021-0110.1%
 
54-103-030-0110.1%
 
54-002-128-0110.1%
 
54-001-025-0210.1%
 
54-002-054-0110.1%
 
54-002-174-0110.1%
 
54-102-239-0210.1%
 
Other values (944)94499.0%
 
2022-06-17T17:02:08.629826image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Frequencies of value counts

Unique

Unique954 ?
Unique (%)100.0%
2022-06-17T17:02:08.717983image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram of lengths of the category

Length

Max length13
Median length13
Mean length13
Min length13
Distinct2
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
0
508 
1
446 
ValueCountFrequency (%) 
050853.2%
 
144646.8%
 
2022-06-17T17:02:08.780469image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

ОНМК
Boolean

Distinct2
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
0
913 
1
 
41
ValueCountFrequency (%) 
091395.7%
 
1414.3%
 
2022-06-17T17:02:08.811711image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Distinct2
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
0
837 
1
117 
ValueCountFrequency (%) 
083787.7%
 
111712.3%
 
2022-06-17T17:02:08.842954image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Distinct2
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
0
858 
1
96 
ValueCountFrequency (%) 
085889.9%
 
19610.1%
 
2022-06-17T17:02:08.874201image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Distinct2
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size7.5 KiB
0
868 
1
 
86
ValueCountFrequency (%) 
086891.0%
 
1869.0%
 
2022-06-17T17:02:08.905444image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Час засыпания
Real number (ℝ≥0)

ZEROS

Distinct9
Distinct (%)0.9%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean14.8081761
Minimum0
Maximum23
Zeros235
Zeros (%)24.6%
Memory size7.5 KiB
2022-06-17T17:02:08.952305image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Quantile statistics

Minimum0
5-th percentile0
Q11
median22
Q323
95-th percentile23
Maximum23
Range23
Interquartile range (IQR)22

Descriptive statistics

Standard deviation10.55192011
Coefficient of variation (CV)0.7125739214
Kurtosis-1.579384194
Mean14.8081761
Median Absolute Deviation (MAD)1
Skewness-0.6378993251
Sum14127
Variance111.3430181
MonotocityNot monotonic
2022-06-17T17:02:09.030415image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram with fixed size bins (bins=9)
ValueCountFrequency (%) 
2336237.9%
 
023524.6%
 
2220721.7%
 
1707.3%
 
21515.3%
 
2242.5%
 
2020.2%
 
320.2%
 
1210.1%
 
ValueCountFrequency (%) 
023524.6%
 
1707.3%
 
2242.5%
 
320.2%
 
1210.1%
 
ValueCountFrequency (%) 
2336237.9%
 
2220721.7%
 
21515.3%
 
2020.2%
 
1210.1%
 

Час пробуждения
Real number (ℝ≥0)

Distinct11
Distinct (%)1.2%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean6.818658281
Minimum0
Maximum12
Zeros1
Zeros (%)0.1%
Memory size7.5 KiB
2022-06-17T17:02:09.092893image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Quantile statistics

Minimum0
5-th percentile5
Q16
median7
Q38
95-th percentile9
Maximum12
Range12
Interquartile range (IQR)2

Descriptive statistics

Standard deviation1.366526791
Coefficient of variation (CV)0.2004099244
Kurtosis1.198852715
Mean6.818658281
Median Absolute Deviation (MAD)1
Skewness0.3992282372
Sum6505
Variance1.86739547
MonotocityNot monotonic
2022-06-17T17:02:09.187831image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram with fixed size bins (bins=11)
ValueCountFrequency (%) 
631633.1%
 
726327.6%
 
815215.9%
 
5919.5%
 
9717.4%
 
10282.9%
 
4222.3%
 
1240.4%
 
1130.3%
 
330.3%
 
ValueCountFrequency (%) 
010.1%
 
330.3%
 
4222.3%
 
5919.5%
 
631633.1%
 
ValueCountFrequency (%) 
1240.4%
 
1130.3%
 
10282.9%
 
9717.4%
 
815215.9%
 

Interactions

2022-06-17T17:01:58.507254image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:01:58.601102image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:01:58.702987image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:01:58.812337image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:01:58.921657image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:01:59.018887image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:01:59.128236image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:01:59.547545image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:01:59.655184image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:01:59.749659image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:01:59.859036image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:01:59.968386image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:00.077734image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:00.171464image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:00.280812image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:00.390165image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:00.499510image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:00.608860image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:00.702295image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:00.811644image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:00.920992image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:01.030341image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:01.139693image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:01.249040image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:01.342768image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:01.452117image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:01.545846image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:01.654240image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:01.749762image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:01.843490image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:01.937220image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:02.046574image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:02.140295image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:02.260601image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:02.354358image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:02.463707image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Correlations

2022-06-17T17:02:09.297214image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Pearson's r

The Pearson's correlation coefficient (r) is a measure of linear correlation between two variables. It's value lies between -1 and +1, -1 indicating total negative linear correlation, 0 indicating no linear correlation and 1 indicating total positive linear correlation. Furthermore, r is invariant under separate changes in location and scale of the two variables, implying that for a linear function the angle to the x-axis does not affect r.

To calculate r for two variables X and Y, one divides the covariance of X and Y by the product of their standard deviations.
2022-06-17T17:02:09.625256image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Spearman's ρ

The Spearman's rank correlation coefficient (ρ) is a measure of monotonic correlation between two variables, and is therefore better in catching nonlinear monotonic correlations than Pearson's r. It's value lies between -1 and +1, -1 indicating total negative monotonic correlation, 0 indicating no monotonic correlation and 1 indicating total positive monotonic correlation.

To calculate ρ for two variables X and Y, one divides the covariance of the rank variables of X and Y by the product of their standard deviations.
2022-06-17T17:02:09.967630image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Kendall's τ

Similarly to Spearman's rank correlation coefficient, the Kendall rank correlation coefficient (τ) measures ordinal association between two variables. It's value lies between -1 and +1, -1 indicating total negative correlation, 0 indicating no correlation and 1 indicating total positive correlation.

To calculate τ for two variables X and Y, one determines the number of concordant and discordant pairs of observations. τ is given by the number of concordant pairs minus the discordant pairs divided by the total number of pairs.
2022-06-17T17:02:10.311298image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Phik (φk)

Phik (φk) is a new and practical correlation coefficient that works consistently between categorical, ordinal and interval variables, captures non-linear dependency and reverts to the Pearson correlation coefficient in case of a bivariate normal input distribution. There is extensive documentation available here.
2022-06-17T17:02:10.686815image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Cramér's V (φc)

Cramér's V is an association measure for nominal random variables. The coefficient ranges from 0 to 1, with 0 indicating independence and 1 indicating perfect association. The empirical estimators used for Cramér's V have been proved to be biased, even for large samples. We use a bias-corrected measure that has been proposed by Bergsma in 2013 that can be found here.

Missing values

2022-06-17T17:02:02.764963image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-06-17T17:02:03.921502image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Sample

First rows

df_indexIDПолСемьяЭтносНациональностьРелигияОбразованиеПрофессияВы работаете?Выход на пенсиюПрекращение работы по болезниСахарный диабетГепатитОнкологияХроническое заболевание легкихБронжиальная астмаТуберкулез легкихВИЧ/СПИДРегулярный прим лекарственных средствТравмы за годПереломыСтатус КуренияВозраст куренияСигарет в деньПассивное курениеЧастота пасс курАлкогольВозраст алкогВремя засыпанияВремя пробужденияСон после обедаСпорт, клубыРелигия, клубыID_yАртериальная гипертензияОНМКСтенокардия, ИБС, инфаркт миокардаСердечная недостаточностьПрочие заболевания сердцаЧас засыпанияЧас пробуждения
0054-102-358-02Мв браке в настоящее времяевропейскаяРусскиеХристианство3 - средняя школа / закон.среднее / выше среднегонизкоквалифицированные работники1000000000000Курит15.020.000употребляю в настоящее время18.02022-06-17 22:00:002022-06-17 06:00:0000054-102-358-0200000226
1154-103-101-01Жв разводеевропейскаяРусскиеХристианство5 - ВУЗдипломированные специалисты0001000000101Никогда не курил(а)0.00.000никогда не употреблял0.02022-06-17 00:00:002022-06-17 04:00:0010054-103-101-011100004
2254-501-026-03Жв браке в настоящее времяевропейскаяРусскиеХристианство5 - ВУЗдипломированные специалисты0000000000100Никогда не курил(а)0.00.011-2 раза в неделюупотребляю в настоящее время17.02022-06-17 23:00:002022-06-17 07:00:0000054-501-026-0300000237
3354-501-094-02Мв браке в настоящее времяевропейскаяРусскиеАтеист / агностик3 - средняя школа / закон.среднее / выше среднегонизкоквалифицированные работники1000010000100Бросил(а)12.010.013-6 раз в неделюупотребляю в настоящее время13.02022-06-17 23:00:002022-06-17 07:00:0000054-501-094-0210000237
4454-503-022-01Жв браке в настоящее времяевропейскаяРусскиеХристианство3 - средняя школа / закон.среднее / выше среднегооператоры и монтажники установок и машинного оборудования0011100000101Никогда не курил(а)0.00.01не менее 1 раза в деньупотребляю в настоящее время16.02022-06-17 23:00:002022-06-17 06:00:0000054-503-022-0110110236
5554-002-074-01Жв браке в настоящее времяевропейскаяРусскиеХристианство5 - ВУЗдипломированные специалисты0000000000100Никогда не курил(а)0.00.000употребляю в настоящее время35.02022-06-17 23:00:002022-06-17 06:00:0000054-002-074-0100000236
6654-602-027-01Жгражданский брак / проживание с партнеромевропейскаяРусскиеХристианство2 - начальная школаслужащие1000100000101Никогда не курил(а)0.00.000никогда не употреблял0.02022-06-17 23:00:002022-06-17 05:30:0000054-602-027-0100000235
7754-102-072-01Мгражданский брак / проживание с партнеромевропейскаяАзербайджанцыИслам4 - профессиональное училищенизкоквалифицированные работники0110000000100Бросил(а)18.01.011-2 раза в неделюупотребляю в настоящее время12.02022-06-17 23:00:002022-06-17 06:00:0000054-102-072-0100100236
8854-102-145-01Жгражданский брак / проживание с партнеромевропейскаяРусскиеХристианство4 - профессиональное училищеслужащие1000000000100Никогда не курил(а)0.00.000употребляю в настоящее время17.02022-06-17 23:00:002022-06-17 07:00:0000054-102-145-0100001237
9954-002-002-01Мв разводеевропейскаяРусскиеХристианство5 - ВУЗдипломированные специалисты1000000000000Никогда не курил(а)0.00.000употребляю в настоящее время18.02022-06-17 23:00:002022-06-17 08:00:0001054-002-002-0100000238

Last rows

df_indexIDПолСемьяЭтносНациональностьРелигияОбразованиеПрофессияВы работаете?Выход на пенсиюПрекращение работы по болезниСахарный диабетГепатитОнкологияХроническое заболевание легкихБронжиальная астмаТуберкулез легкихВИЧ/СПИДРегулярный прим лекарственных средствТравмы за годПереломыСтатус КуренияВозраст куренияСигарет в деньПассивное курениеЧастота пасс курАлкогольВозраст алкогВремя засыпанияВремя пробужденияСон после обедаСпорт, клубыРелигия, клубыID_yАртериальная гипертензияОНМКСтенокардия, ИБС, инфаркт миокардаСердечная недостаточностьПрочие заболевания сердцаЧас засыпанияЧас пробуждения
94494554-701-047-01Жвдовец / вдоваевропейскаяРусскиеХристианство4 - профессиональное училищенизкоквалифицированные работники0100000000100Курит16.05.000никогда не употреблял0.02022-06-17 23:00:002022-06-17 07:00:0001154-701-047-0110000237
94594654-101-085-01Жвдовец / вдоваевропейскаяРусскиеХристианство5 - ВУЗдипломированные специалисты0100000000000Никогда не курил(а)0.00.014 и более раз в деньникогда не употреблял0.02022-06-17 01:00:002022-06-17 08:00:0000054-101-085-011000018
94694754-102-174-01Жв браке в настоящее времяевропейскаяРусскиеХристианство5 - ВУЗслужащие0100000000100Никогда не курил(а)0.00.000употребляю в настоящее время18.02022-06-17 23:00:002022-06-17 06:00:0000054-102-174-0110100236
94794854-002-192-01Жвдовец / вдоваевропейскаяРусскиеНет4 - профессиональное училищенизкоквалифицированные работники1000000000000Никогда не курил(а)0.00.013-6 раз в неделюупотребляю в настоящее время17.02022-06-17 23:00:002022-06-17 06:00:0010054-002-192-0100000236
94894954-103-035-01Жв разводеевропейскаяРусскиеХристианство3 - средняя школа / закон.среднее / выше среднегонизкоквалифицированные работники1000000000100Курит20.020.000употребляю в настоящее время25.02022-06-17 23:00:002022-06-17 08:00:0000054-103-035-0110000238
94995054-103-006-01Мв браке в настоящее времяевропейскаяРусскиеХристианство4 - профессиональное училищеоператоры и монтажники установок и машинного оборудования1000000000001Курит16.020.000употребляю в настоящее время18.02022-06-17 22:00:002022-06-17 06:00:0000054-103-006-0100000226
95095154-701-039-01Жвдовец / вдоваевропейскаяРусскиеХристианство3 - средняя школа / закон.среднее / выше среднегонизкоквалифицированные работники1000000000100Курит15.010.000ранее употреблял26.02022-06-17 21:30:002022-06-17 07:15:0000054-701-039-0100000217
95195254-002-014-01Жв браке в настоящее времяевропейскаяРусскиеХристианство3 - средняя школа / закон.среднее / выше среднегослужащие0100000000100Бросил(а)20.010.000употребляю в настоящее время20.02022-06-17 22:30:002022-06-17 08:00:0010054-002-014-0110100228
95295354-501-022-01Жв браке в настоящее времяевропейскаяРусскиеАтеист / агностик5 - ВУЗпредставители законодат. органов власти, высокопостав. долж.лица и менеджеры1000100000100Никогда не курил(а)0.00.000употребляю в настоящее время21.02022-06-17 23:00:002022-06-17 08:30:0001054-501-022-0100000238
95395454-702-016-01Мв браке в настоящее времяевропейскаяРусскиеХристианство4 - профессиональное училищеоператоры и монтажники установок и машинного оборудования1000000000001Курит10.030.000употребляю в настоящее время17.02022-06-17 22:00:002022-06-17 05:00:0010054-702-016-0100000225